面向移动商务的数据挖掘方法及应用研究

面向移动商务的数据挖掘方法及应用研究

作者:师大云端图书馆 时间:2015-11-05 分类:期刊论文 喜欢:3436
师大云端图书馆

【摘要】近年来,随着移动互联网相关技术的高速发展,各种移动应用和服务在规模上呈现出前所未有的增长态势。种类繁多的移动应用和服务覆盖了诸如生活娱乐、在线社交、导航定位等各种功能层面,从而满足了移动用户在日常生活中各式各样的功能需求。与此同时,这些移动应用和服务也产生了海量的用户交互记录与历史商务数据,为研究者深入探索移动商务环境下的潜在价值、开发全新的移动商务应用和服务带来了全新的机遇和挑战。事实上,针对移动商务智能的研究方兴未艾,近年来在国际学术界和产业界均受到广泛的重视。基于以上背景,本文开展了针对移动商务的数据挖掘方法的一系列探索性研究。具体地,结合来自于智能移动应用程序(简称移动App)的新型商务数据,从用户理解、应用理解、应用孵化等三个层面开展了研究工作。基于这三个层面,分别提出了情境感知的移动用户个性化偏好挖掘方法、基于扩展信息的移动App分类方法、面向移动App的排名欺诈检测方法、面向移动App的流行度建模方法、安全隐私感知的移动App推荐方法等探索性工作。具体而言,本文的主要研究贡献总结如下:第一,通过分析来自于用户移动设备的丰富情境日志,提出了一种情境感知的移动用户个性化偏好挖掘方法,从而帮助实现基于情境感知的个性化移动推荐系统。针对情境日志缺乏显式评分、记录稀疏、特征复杂等挑战,设计了一种全新的基于多用户数据的偏好挖掘框架。在此框架下,首先通过对多用户情境数据的分析来挖掘移动用户的公共偏好。然后,将单个用户的个性化偏好表示为这些公共偏好上的概率分布。特别地,根据情境数据建模的需要,提出了两种不同的情境建模独立性假设,并且分别根据这两种假设设计了不同的方法来挖掘移动用户的个性化偏好。具体来说,当情境数据被认为是相互条件独立的,采用概率主题模型对情境数据和用户行为进行建模;如果情境数据被认为是相互依赖的,则采用行为模式挖掘算法和贝叶斯非负矩阵分解的办法来进行建模。最后,在一个真实世界的数据集上进行了实验,实验结果表明本文提出的方法相对于其他基准方法能够更好地为移动用户提供基于情境感知的个性化推荐。第二,通过扩展来自于Web和情境日志的辅助信息,提出了一种自动化的移动App分类方法,从而实现移动用户的行为理解以及移动App的管理需求。针对移动App缺乏必要的上下文信息训练分类器这一难题,提出了一个全新的分类框架。该框架可以利用外部的辅助信息扩充移动App本身稀少的上下文信息,从而使得我们能够对移动App进行有效的分类。具体来说,首先利用Web搜索引擎为移动App扩充必要的文本信息,并且基于此提出了多个有效的分类特征。其次,基于近年来在情境信息领域的研究成果,提出使用真实世界的情境日志来为移动App扩充上下文信息,并设计了多个有效的基于情境感知的分类特征。随后,将提取的各种特征整合到经典的最大熵分类模型中来训练一个高效的移动App分类器。最后,在一个真实的移动App数据集上测试了提出的分类方法,实验结果表明本文提出的方法相比其它基准方法能够更加有效地对移动App进行分类。第三,通过研究来自于在线移动App商店的长期商务数据,提出了一种面向移动App的排名欺诈检测方法,从而发现不良App开发商的恶意刷榜行为。具体而言,首先定义了面向移动App的排名欺诈问题,然后介绍和分析了解决这一问题所面临的诸多技术挑战,例如欺诈时间定位、欺诈自动化检测、欺诈证据提取等等。基于上述挑战,开发了一个全自动化的移动App排名欺诈检测系统。首先通过挖掘移动App在排行榜上的活跃周期来定位排名欺诈可能出现的时间段。然后通过对各个App在历史中的排名记录和用户评分、评论记录进行分析,提取出了三类共七种欺诈证据。进一步,提出了一种全新的非监督证据整合方法来实现最后的排名欺诈检测。最后,使用AppleAppstore中超过两年的App排行榜数据进行实验,结果证明本文提出的方法能够有效地检测出移动App排名欺诈现象。第四,通过整合来自于移动App的多种异构流行度信息,提出了一种面向移动App的流行度建模方法,从而帮助实现多种移动智能服务。目前基于移动App流行度的相关研究十分离散,主要分散在移动推荐系统、移动App异常检测等领域,缺乏一个综合的模型对相关信息和问题进行整合。针对这一挑战,提出了一种基于隐马尔科夫模型的扩展模型对App的排名、用户评分、用户评论等三种重要流行度信息进行综合建模。同时,提出了一种基于二部图聚类的模型参数估计方法,用以实现高效的模型训练。特别地,基于所提出的模型,展示了多种潜在的移动智能服务,比如基于趋势的移动App推荐等等。最后,在两个采集于AppleAppsotre的数据集中进行了丰富的实验,实验结果清晰地验证了本文所提出建模方法的有效性。最后,通过挖掘来自于移动App的数据访问权限和流行度信息,提出了一种安全隐私感知的移动App推荐方法,从而满足移动用户在安全隐私保护方面的需求,并促进移动App产业的健康发展。事实上,现有的移动App推荐系统仅仅考虑评分、下载量等流行度信息,而不考虑其潜在的安全隐私风险,因此很难满足移动用户对于安全隐私保护的需求。针对这一问题,设计了一种全新的移动App推荐系统,用来为用户推荐既流行又安全的移动App。首先,提出了一个扩展性良好的移动App安全隐私风险评估方法,这一方法可以自由整合各种关于安全隐私风险的先验信息,并且不需要任何的显式函数定义。紧接着,根据经济学中的投资组合理论,提出了一种全新的优化方法来实现移动App推荐时在流行度与用户安全偏好上的折中。特别地,进一步设计了一个新颖的数据存储结构App哈希树,用来实现海量移动App在不同类别和安全级别下的快速推荐和管理。最后,在一个采集自GooglePlay的大规模数据集上进行了实验,实验结果充分地验证了本文所提出的移动App安全风险评估方法,以及推荐算法的有效性。
【作者】祝恒书;
【导师】陈恩红;
【作者基本信息】中国科学技术大学,计算机应用技术,2014,博士
【关键词】移动用户;移动商务;移动App;情境感知;推荐系统;

【参考文献】
[1]李铭佳.大众视觉效果下二维与三维动画相结合的研究[D].长春工业大学,设计艺术学,2013,硕士.
[2]白玉.台湾地区起诉审查制度研究[D].山东大学,诉讼法学,2013,硕士.
[3]王笃祥.对抗与融合—中国当代青年艺术研究[D].山东师范大学,艺术学,2013,硕士.
[4]新型.各国石墨烯产业化研究热点分析[J].化工新型材料,2014,10:238.
[5]彭水淼.企业成长能力对债务融资的影响研究[D].河北经贸大学,会计学,2014,硕士.
[6]林道光.相变材料蓄热特性的模拟研究[D].湖南科技大学,供热、供燃气、通风及空调工程,2013,硕士.
[7]李志.TEA阻断BKCa离子通道对血管平滑肌细胞增殖的影响及机制的研究[D].广西医科大学,心血管内科(专业学位),2013,硕士.
[8]丛秉华.冲量式谷物测产传感器及试验台研制[D].南京农业大学,农业机械化工程,2013,硕士.
[9]孙学娟.我国城乡一体化进程中集体建设用地流转问题研究[D].首都经济贸易大学,行政管理,2013,硕士.
[10]薛晓燕.以德治国的维度[D].首都师范大学,马克思主义理论与思想政治教育,2004,硕士.
[11]王敬涵.沈阳市高中体育教师教学风格及其影响因素研究[D].沈阳体育学院,体育人文社会学,2014,硕士.
[12]刘书,吴生富,王龙春.E4B500-MF落料压力机上梁主传动方案设计[J].一重技术.1997(03)
[13]艾伦B·坎宁安.速度谱的解释[J].石油地球物理勘探,1976,S1:6.
[14]朱丽云.历史概念教学初探[D].华中师范大学,学科教学,2014,硕士.
[15]李渐波.巨型框架抗震性能分析[D].长安大学,结构工程,2014,硕士.
[16]瞿慧萍.CcpA在单核细胞增生李斯特菌中的功能初探[D].华中师范大学,生物化学与分子生物学,2014,硕士.
[17]李贤甲.新课程理念下地理实践活动的研究[D].河北师范大学,学科教学,2013,硕士.
[18]连海燕.基于分数阶傅里叶变换的浅海水声定位关键问题研究[D].厦门大学,电子与通信工程,2014,硕士.
[19]林长庆.头孢卡品人体内定量分析方法及药代动力学研究[D].吉林大学,药物分析学,2013,硕士.
[20]刘沙.非肌性肌球蛋白重链9基因多态性与中国北方汉族人群ESRD易感性相关研究[D].河北医科大学,外科学,2013,硕士.
[21]张海.黄连碱体外抗炎作用及其机制研究[D].成都中医药大学,药理学,2012,硕士.
[22]王斯龙.消费者感知风险对二手房购买意愿的影响研究[D].浙江工商大学,企业管理,2013,硕士.
[23]郭晋欣.高速公路收费雨棚在极限偶然荷载作用下安全性能分析[D].山东建筑大学,结构工程,2013,硕士.
[24]张晔.链孢粘帚霉HL-1-1寄生核盘菌菌核相关基因的研究[D].新疆农业大学,植物病理学,2012,硕士.
[25]宋丽梅,纪成军.解析BOSS系统对移动数据业务的支撑[J].通信世界,2004,27:38-39.
[26]凌云,郭向宇,孙祥娥,高军,孙德胜,林吉祥.地震勘探中的各向异性影响问题研究[J].石油地球物理勘探,2010,04:606-624+472.
[27]沈飞,徐德,唐永建,吴文荣,余大海.微操作/微装配中微力觉的测量与控制技术研究现状综述[J].自动化学报,2014,05:785-797.
[28]毛兰慧.气相甲醇脱水制二甲醚工艺模拟与优化[D].郑州大学,化学工程(专业学位),2013,硕士.
[29]王丽娜,董晓梅,于戈,王东.基于进化神经网络的入侵检测方法[J].东北大学学报,2002,02:107-110.
[30]郭剑.某大型国有企业完善集团治理体系建设研究[D].厦门大学,工商管理(EMBA),2014,硕士.
[31]杨晓波.国有控股钢铁企业盈利能力问题探讨[D].江西财经大学,会计学,2013,硕士.
[32]阿列克西娜(AlexinaEghan).全球公关:中国企业扩展到加纳[D].浙江大学,大众传播,2013,硕士.
[33]汪洋.WTO背景下中国农业补贴问题研究[D].东北财经大学,财政学,2003,硕士.
[34]马庆庆,葛宝明,毕大强,李硕.高速SRM无位置传感器控制[J].电机与控制学报,2014,11:1-7.
[35]张林啸.橡胶扭转减振器特性的研究[D].华南理工大学,车辆工程,2012,硕士.
[36]张海龙.多种工况下履带车辆主动轮应力测试系统研究[D].中北大学,通信与信息系统,2014,硕士.
[37]罗旭红.基因水平的疾病遗传关联分析方法研究[D].宁波大学,流行病与卫生统计学,2014,硕士.
[38]冯彩平.吕梁市农村社会救助制度建设问题研究[D].山西财经大学,社会保障,2013,硕士.
[39]张金国.生物化学课教学研究与实践[J].安阳大学学报.2002(03)
[40]华凌.美用石墨烯油墨打印出高导电柔性电极[N].科技日报,2013-05-06002.
[41]刘建勇.参附注射液对兔肢体缺血再灌注损伤的影响[D].重庆医科大学,外科学,2004,硕士.
[42]NamT.Nguyen,SvethaVenkatesh,GeoffWest,HungH.Bui.监控系统中的多摄像机协同(英文)[J].自动化学报,2003,03:408-422.
[43]卞先锋.西安新科集团公司投资信息管理系统开发研究[D].西安理工大学,工商管理,2004,硕士.
[44]凌宇.钙及维生素D对早期乳腺癌患者骨量的影响[D].南方医科大学,肿瘤学,2012,硕士.
[45]王曼.两种Janus粒子的制备及其性能研究[D].苏州大学,材料物理与化学,2014,硕士.
[46]王峰.自动喷水—泡沫联用灭火系统关键部件的设计与研究[D].上海海洋大学,机械设计及理论,2014,硕士.
[47]王健.几类互连网络拓扑结构图的反馈数研究[D].大连理工大学,计算机软件与理论,2013,硕士.
[48]王建涛.基于PDM平台企业产品并行设计的系统集成研究[D].上海大学,1999.
[49]田鹏.基于遗传算法的机床主轴优化CAD系统的研究[D].东北大学,机械电子工程,2010,硕士.
[50]尹姗姗.佛教寺院与隋唐长安城市布局[D].辽宁大学,历史地理学,2012,硕士.

相关推荐
更多